4.3 Информационно-поисковые системы

Информационная поисковая система (ИТС) - это комплексная система, обеспечивающая хранение, поиск и выдачу необходимой информации по запросам пользователей.
Основные функции:

Информационный поиск - совокупность логических и технических операций, имеющих конечной целью нахождение инф. релевантной запросу потребителя.

Поисковой запрос - фраза или набор ключевых слов, которые пользователь вводит в поисковую строку для получения информации.

Релевантность - это соответствие результатов поиска сформулированному запросу пользователя

Пертинентность - это соответствие результатов поиска информационным потребностям (ожиданиям и целям) пользователя

Ранжирование - это процесс определения порядка или приоритета элементов в наборе данных на основе определенных критериев


Компоненты информационно-поисковой системы

Краулер - сканирует и собирает данные из различных источников. Он следует гиперссылкам и индексирует содержимое для дальнейшего использования в поиске.

Индексатор - обрабатывает собранные данные и создает индексы, представляющие собой структурированный набор метаданных, облегчающие последующий поиск

Хранилище данных - хранит собранную и обработанную информацию. Может включать как сами документы, так и созданные индексы.

Модуль обработки запросов - преобразует запросы пользователя, выполняет поиск в индексе на основании обработанного запроса, определяет порядок выдачи результатов.

Интерфейс пользователя - часть системы, с которой взаимодействует пользователь, позволяющее формулировать запросы и получать результаты поиска.

Механизм обратной связи - алгоритмы, учитывающие реакцию пользователя на результаты поиска для улучшения будущих запросов на основе предпочтений и поведения.


Виды ИПС:

Интернет ИПС - поиск информации в Интернете
Корпоративные ИПС - поиск внутри организации
Библиотечные и архивные ИПС - поиск в библиотеках, архивах, специализированных базах знаний.
Научные ИПС - поиск научной литературы, статей, диссертаций и др.
Патентные ИПС - поиск патентной информации, регистрации патентов и заявок.
Медицинские ИПС - поиск медицинской информации, клинических исследований, лекарственных препаратов


Этапы развития ИПС

Ранние этапы - 1950-е
Появление интернета - 1980-е
Революция поисковых систем - 1990-е
Интернет как основной источник - 2000-е
Современная эпоха - 2010-е


Индексация данных - процесс создания и управления специальной структурой данных, которая позволяет быстро искать информацию в больших объемах данных. Индексы содержат ссылки на записи или документы, которые соответствуют определенным критериям поиска.
Шаги индексации:


Классификация информации - процесс организации и структурирования данных для облегчения поиска и доступа к ним. Классификация позволяет разделить информацию на категории или группы, что упрощает поиск нужных данных.
Основные методы:


Методы ранжирования:


Пользовательский интерфейс

Пользовательский интерфейс - это совокупность элемента, через которые пользователи взаимодействуют с системой для выполнения задач поиска информации. Это интерфейс включает в себя визуальные компоненты, такие как кнопки, поля ввода, списки, фильтры и другие элементы управления, а также логику взаимодействия между пользователями и системой.
Принципы проектирования:


Тенденции развития